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摘 要 : [目的 /意义 ] 知 识 的 积累 与 传承 推动 着 人 类 社会 的 发 展 ,为 此 提出 利用 科技 文献 知识 基因 进行 知识 的 遗传 与 变异 
研究 ,以 期 对 知识 传承 与 发 展 变化 进行 更 直观 全面 地 透视 。 [ 方法 “过程 ] 通 过 辨析 知识 基因 概念 ,确定 知识 基因 
的 研究 意义 ,并 探讨 其 具体 研究 对 象 ; 提 出 科技 文献 知识 基因 内 容 表达 的 两 种 方式 ,归纳 科技 文献 知识 基因 的 类 
型 ;分 析 影 响 知 识 基因 遗传 与 变异 的 主要 因素 ,上 且 设计 识别 知识 基因 的 遗传 与 变异 的 方法 。[ 结果 /结论 ] 通过 对 
科技 文献 知识 基因 的 辨识 ,能 够 有 效 揭示 出 不 同文 献 之 间 的 知识 传承 与 迭代 ,促进 知识 基因 理论 体系 的 发 展 与 


词 : 模 因 知识 基因 知识 基因 遗传 知识 基因 变异 文本 内 容 分 析 


号 : G250 
0Gt 10. 13266/j. issn. 0252 -3116.2020. 04. 009 


屋外 的 最 小 单元 , 字 节 ( 比特 ) 是 数字 信息 的 最 小 音 
元 ,基因 是 生物 信息 与 遗传 的 最 小 单元 。 为 什么 这 些 


们 氏 有 充分 理解 基础 概念 ,才能 领悟 其 特性 或 演化 规 
律 二 字 节 与 基因 只 是 人 类 发 明 的 符号 ,精妙 的 自然 法 
则 大 数字 化 信息 理论 的 支撑 中 。 基 于 字 节 与 基因 共同 
遵循 的 自然 法 则 规律 ,可 相互 支撑 对 相关 领域 的 科学 
知识 ,产生 新 的 领域 。 

基因 的 研究 基于 碳 基 生命 ,知识 基因 的 研究 则 是 基 
于 人 类 科研 成 果 最 重要 的 载体 一 科技 文献 。 本 文通 
过 对 知识 基因 狭义 及 广义 定义 的 梳理 ,明确 知识 基因 的 
研究 意义 ,并 探讨 其 具体 研究 对 象 ;分 析 知 识 基因 的 类 
型 .影响 知识 基因 遗传 与 变异 的 因素 ,展望 知识 基因 的 
未 来 发 展 方向 ,促进 知识 基因 理论 体系 的 发 展 与 完善 。 


1 知识 基因 定义 


道 金 斯 最 早 在 基因 与 知识 之 间 建 立 联系 ” 。 他 认 


为 存在 脱离 化 学 物质 的 “基因 ”, 这 种 “基因 ”的 “ 汤 " 为 
人 类 文化 ,传递 载体 为 语言 , 产 卵 场 为 大 脑 。 他 赋予 其 
新 的 名 字 “ 模 因 (meme)”。 模 因 产 生 于 大 脑 ,并 在 纸 
张 .胶卷 . 奎 片 等 信息 载体 上 建立 滩头 堡 。 简单 的 想法 
如 颜色 及 数字 等 类 似 于 单个 核 苷 酸 ,不 足以 成 为 模 因 。 
模 因 应 像 基 因 一 样 是 复杂 的 单元 ,并 具有 一 定 的 持久 
力 ”。 在 道 金 斯 提出 meme 概念 后 ,meme 在 国内 外 得 
到 广泛 关注 与 研究 。 

在 国外 ,早期 遗传 学 家 利用 基因 的 遗传 与 变异 得 
出 阶级 分 层 不 利于 推进 社会 公平 的 结论 " ,因而 ,大 部 
分 社会 学 家 对 基因 学 说 持 抵触 态度 。 此 后 ,meme 被 用 
于 文化 研究 。S. K. Sen 在 文化 基因 基础 上 提出 情报 基 
的 概念 ,情报 通过 情报 基因 遗传 . 试 错 检验 等 逐渐 稳 
定 与 增长 ”| 。S. Blackmore 在 The Meme Machine 一 书 
中 定义 知识 基因 是 高 保 真 复制 ,高 繁殖 力 和 生命 力 强 
的 复制 子 ”"。R. Aunger 在 The Electric Meme 书 中 从 语 
言 学 角度 分 析 meme, 认 为 流行 语 也 是 一 种 meme ,强调 
meme 在 流行 文化 中 的 解释 作用 ”。 在 这 些 研究 中 ,学 
者 未 划分 其 研究 边界 缺乏 严格 定义 、 难 以 将 研究 数学 
化 ,从 而 使 文化 基因 过 于 抽象 无形. 不 可 度量 ” ,只 
能 在 文化 进化 理论 及 心灵 进化 理论 的 研究 中 起 解释 作 
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用 ,而 无 法 开展 应 用 实践 。 

在 国内 , 李 伯 文 认 为 知识 基因 就 是 科学 概念 。 
刘 植 惠 认为 此 定义 过 于 宽泛 ,从 而 对 知识 基因 重新 定 
义 :知识 基因 是 知识 进化 的 最 小 功能 单元 ,具有 稳定 
性 .遗传 与 变异 性 ` 统 摄 性 .指向 性 ,其 目的 是 摸 清 知 识 
进化 规律 。 刘 植 惠 详 细 阐 述 了 知识 基因 的 定义 、 
特征 ,分 类 、 科 学 定律 .应 用 及 遗传 运动 与 变异 运动 
等 "1 。 孙 晓 玲 将 在 文献 中 经 常 出 现 的 词语 或 短语 定 
义 为 重要 的 知识 基因 ,并 结合 文献 中 词语 出 现 次 数 及 
在 引文 网 络 中 的 传播 程度 ,计算 知识 基因 强度 。 刘 
则 渊 认为 知识 基因 是 在 特定 知识 领域 所 构成 的 自 组 织 
知识 系统 ,可 展示 出 知识 的 产生 \ 演 化 与 重组 涌现. 断 
层 和 变革 ,传播 和 应 用 等 "5 。 和 人 金 生 等 人 研究 了 知识 
基因 在 企业 创新 过 程 中 的 作用 与 反馈 机 制 !” 。 顾 新 
嫂 畏 使 用 SA0 三 元 组 方法 从 专利 引证 网 络 中 提取 知 
识 吐 因 并 建立 知识 进化 轨迹 9 。 丁 蔚 等 使 用 知识 基 
六 现 算法 识别 知识 进化 与 冲突 中 起 关键 作用 的 知识 
ji 。 谭 宗 颖 等 构建 了 基于 知识 基因 游离 与 重组 
的 在 题 演化 研究 模型 ,以 了 解 学 科 领 域 的 发 展 和 演化 
和 ,学 和 领域 的 研究 主题 布局 。 
QJ 由 上 述 知识 基因 发 展 历程 及 应 用 场景 可 知 ,知识 
苦于 是 知识 进化 轨迹 的 基本 单位 ,可 利用 知识 基因 发 
珊 宰 挖掘 隐 合 的 .未 知 的 .潜在 的 有 价值 知识 ,为 知识 
创 产 提供 智力 支持 。 但 是 在 知识 基因 概念 描述 方面 较 
及 类 , 仅 使 用 解释 性 语言 描述 知识 基因 理论 及 知识 
酝 识 别 算法 能 够 完成 的 任务 ,但 并 未 说 明知 识 基因 
是 靳 么 ,为 什么 可 完成 任务 等 重要 知识 。 虽 然 文章 标 
明知 识 基 因 , 但 在 实际 应 用 过 程 中 仍 使 用 主题 词 .关键 
词 等 表征 知识 基因 。 

笔者 认为 ,科技 文献 知识 基因 是 模 因 的 意义 表达 
类 型 之 一 ,是 科技 文献 文本 内 容 中 表征 文献 价值 的 知 
识 对 象 的 有 机 结合 体 ,是 科技 创新 中 最 基本 、 最 活跃、 
影响 面 最 宽 的 知识 内 容 。 知 识 基因 由 原始 文献 摘要 及 
施 引文 献 引文 内 容 组 成 。 由 于 施 引 文献 在 对 原始 文献 
引用 时 ,引用 内 容 并 不 一 定 是 原始 文献 最 突出 的 创新 
点 ,通过 二 者 的 有 机 结合 .重组 可 以 得 到 科技 文献 的 知 
识 基因 。 

科技 文献 的 知识 基因 生成 过 程 应 该 由 以 下 几 个 步 
又 :首先 ,提取 原始 文献 摘要 及 施 引文 献 引文 内 容 的 类 
别 标签 ;其 次 ,识别 引文 内 容 的 引用 位 置 .引用 情感 . 引 
用 功能 .引用 性 质 ;最 后 ,根据 上 述 标注 计算 遗传 与 变 
异 结果 , 见 图 1。 

在 上 述 知识 基因 生成 基础 上 ,通过 综合 引用 类 别 


主观 、 静 态 客观 、 动 态 


描述 文献 描述 文献 
施 引 文献 B | 施 引文 献 了 
文献 导 EE ee 
原始 文献 oe | 施 引文 献 C [9 
搞 要 | ”引文 引文 
年 份 2008 2009 2010 2011 2012 
类 通 模型 概念 概念 模型 ”” ”方法 
加 齐 上 定 病因 病因 症状 病因  ， 诊断 
断 j 引 用 位 置 “一 | 结果 讨论 。 ”综述 引言 实验 
在 引用 情史 “一 | 中立 积极 积极 消极 
引用 9 指 “一 | 延伸 研 究 ”相关 研究 现 有 研究 。 ”比较 研究 
引用 性 质 “一 定义 实 定义 
判别 公式 
遗传 或 变异 | “一 | ”遗传 遗传 遗传 变异 


图 1 科技 文献 知识 基因 生成 过 程 


标注 结果 ,遗传 与 变异 判断 结果 .时 间 等 因素 完成 单 篇 
科技 文献 知识 基因 的 表达 提取 ,如 图 2 所 示 。 图 中 横 
坐标 为 特定 知识 基因 类 别 标签 , 纵 坐 标 为 通用 知识 基 
因 类 别 标 签 ,黄色 表示 原始 文献 ,红色 表示 施 引文 献 的 
引文 内 容 与 原始 文献 为 知识 基因 变异 关系 , 蓝 色 表示 
施 引 文献 的 引文 内 容 与 原始 文献 为 知识 基因 遗传 关 
系 。 在 黄色 红色 或 蓝 色 方块 内 数字 为 科技 文献 的 发 
表 年 份 。 


> 通用 知识 基因 类 别 


EE rex 
| 这 传 
EB 旋 ? 文献, 交 # 


到 例 


图 2 科技 文献 知识 基因 表达 形式 


2 ”知识 基因 与 知识 元 


吴军 在 《见识 》 一 书 中 提 到 ,伟大 的 发 明 总 是 基于 
前 人 的 工作 , 它 所 完成 的 是 从 “N” 到 “N+ 1” 的 过 
程 ”。 基 于 现代 技术 的 飞速 发 展 ,实现 从 0 到 NN 的 全 
过 程 变 得 越发 不 可 实现 。 当 前 科学 发 展 模式 为 在 原来 
的 基础 上 更 进一步 ,站 在 巨人 的 肩膀 上 (N) ,产生 新 的 
技术 或 工具 (1) ,实现 质 的 飞跃 , 徘 着 一 点 点 的 进步 ， 
推动 科技 发 展 。 同 样 ,人 类 在 习 得 知识 过 程 中 并 非 将 
前 人 所 做 设想 与 实验 一 一 验证 ,而 是 直接 将 部 分 知识 
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设 为 定理 等 ,使 人 类 快速 站 在 当前 技术 发 展 前 端 ,致力 
于 新 知识 的 产生 。 在 科技 文献 中 ,N 可 理解 为 原始 论 
文 的 被 引文 献 ,1 可 理解 为 原始 论文 的 摘要 。 当 论文 
被 施 引 文献 引用 时 ,原始 论文 成 为 "N”。 科 技 文 献 在 
“N” 到 “N+1” 的 过 程 中 不 断 演 变 与 发 展 ,因此 单 篇 文 
献 的 知识 基因 应 由 原始 文献 的 摘要 及 其 施 引 文献 的 引 
文 内 容 组 成 。 

由 上 述 可 知 ,知识 基因 是 动态 的 发 展 的 ,而 不 是 
一 成 不 变 的 。 而 目前 通常 讲 的 知识 元 、 知 识 单元 等 概 
念 都 是 指 具体 实际 的 词语 ,这 些 词语 或 是 主题 词 ,或 是 


笔者 认为 知识 基因 应 由 文献 发 表 时 作者 对 文献 创新 性 
的 主观 旦 静态 的 价值 表达 及 施 引 文献 中 对 文献 的 客观 
及 动态 的 价值 组 成 。 静 态 表达 体现 在 文献 的 摘要 之 
中 ,在 其 发 表 时 已 经 固定 不 变 ;动态 客观 描述 体现 在 后 
续 施 引文 献 的 引文 内 容 之 中 ,并 客观 描述 施 引 作者 所 
研究 领域 的 客观 价值 。 
3.1 知识 基因 的 静态 表达 

论文 在 发 表 时 ,科技 文献 自身 价值 已 经 得 到 作者 
本 人 .编辑 及 同行 评审 专家 的 认可 ,构成 其 静态 描述 。 
作者 在 摘要 之 中 将 文献 的 主观 价值 进行 精炼 化 表达 ， 


三 元 组 。 知 识 元 通常 是 通过 对 科技 文献 内 容 利 用 信息 
抽取 ,主题 模型 等 技术 抽取 出 的 固定 存在 。 在 对 知识 
元 的 研究 中 ,许多 学 者 聚焦 在 扩充 主题 词 的 属性 描述 
与 关系 描述 ,如 将 文献 的 来 源 . 版 本 .评论 .访问 记录 等 
售 仿 用 于 表示 知识 元 ,其 主要 目的 是 用 于 表示 知识 , 控 
制 呈 处 理 知识 ,其 最 终 仍 是 碎片 化 知识 1。 

知识 基因 在 表示 知识 时 ,使 用 通用 知识 基因 类 型 
械 台 与 特定 知识 基因 类 型 标签 ,以 防止 因 知识 的 碎片 
做 而 迷失 在 知识 的 海洋 中 。 同 时 ,特定 知识 基因 类 型 
标 徐 根据 知识 领域 的 不 同 而 不 同 ,从 而 使 其 较为 自由 
元 酒 而 不 被 限制 。 两 种 标签 除了 描述 原始 文献 知识 基 
因 玉 ,还 用 于 描述 施 引 文献 引文 内 容 。 由 于 引文 内 容 
的 合计 算 特点 ,可 判断 知识 在 由 原始 文献 向 施 引文 献 
发 谋 的 过 程 中 ,发 生 了 遗传 还 是 变异 。 因 此 ,知识 基因 
往 疙 示 原 始 文献 的 知识 同时 ,引入 了 施 引文 献 的 内 容 
关系 ,内 容 使 用 两 种 标签 类 型 表示 ,关系 使 用 遗传 或 
变 莽 表示 , 随 着 施 引 文献 不 断 产生 ,原始 文献 的 知识 基 
因 的 内 容 不 断 丰 富 。 


3 ”知识 基因 的 组 成 


人 体 的 体 细胞 内 有 23 对 染色 体 ,但 对 性 别 具 有 决 
定 作 用 的 染色 体 只 有 一 对 , 即 第 二 十 三 对 染色 体 ”。 
当 科 研 人 员 的 研究 重点 为 性 别 等 信息 时 ,科研 人 员 会 
着 重 研究 性 染色 体 。 相 似 的 ,在 知识 领域 , 单 篇 文献 会 
涉及 到 多 个 知识 点 ,如 对 解决 问题 的 各 种 方法 综述 ,各 
个 研究 方法 的 实现 工具 综述 等 ,但 文献 的 突出 贡献 点 
是 在 前 人 研究 基础 上 在 方法 等 方面 的 创新 。 为 了 能 准 
确 描述 单 篇 文献 的 突出 贡献 ,知识 基因 的 价值 应 由 知 
识 输出 *N +1” 中 的 “17 决定。 基于 当前 科研 人 员 无 
法 快速 定位 所 需 知 识 的 普遍 现象 ,结合 基因 与 “N+1” 
法 则 ,笔者 认为 ,知识 基因 基于 “N +1” 法 则 中 的 创新 
点 “1” ,是 原始 论文 中 表征 原创 观点 .方法 数据 结论 
等 有 价值 的 知识 单元 的 有 机 结合 体 。 知 识 是 流动 的 ， 


不 加 评论 和 补充 解释 ,最 大 限度 对 单 篇 论文 重要 信息 
进行 简短 ,扼要 而 连贯 的 陈述 ,集中 反映 原文 精华 。 摘 
要 具有 简洁 .明了 独立 性 .完整 性 ,高度 概 括 性 和 自 含 
性 等 特征 ,并 拥有 与 文献 同等 量 的 主要 信息 。 

笔者 认为 ,摘要 的 本 质 是 通过 除去 不 重要 的 内 容 
来 压缩 文献 字数 ,保留 文献 目的 方法 结果、 结论 等 信 
息 性 内 容 ,表达 科 学 结构 合理 、. 逮 辑 严密 ,可 独立 存在 
成 为 二 次 文献 。 摘 要 是 作者 视角 下 , 单 篇 文献 的 价值 
表征 。 通 过 对 摘要 细 粒 度 化 、 结 构 化 .语义 化 表达 ,可 
准确 描述 知识 及 其 相互 之 间 的 关系 。 因 此 ,知识 基因 
的 静态 表达 应 从 文献 的 摘要 之 中 提取 。 
3.2 知识 基因 的 动态 表达 

施 引 文献 作者 通过 引用 对 被 引文 献 客观 价值 进行 
升华 , 随 着 后 续 其 他 科研 人 员 的 引用 与 评价 构成 文献 
后 续 的 动态 价值 。 科 人 研 人 员 的 人 研究 方向 及 看 待 文章 的 
视角 决定 了 这 篇 文献 对 施 引 作者 的 贡献 ,构成 文献 后 
续 的 客观 描述 。 

引文 内 容 是 施 引 文献 基于 当前 发 展 状况 ,对 被 引 
文献 知识 创新 点 的 客观 判断 ,反应 科学 知识 的 递增 性 
规律 ,在 表征 被 引文 献 对 后 续 研 究 的 主要 贡献 同时 , 相 
比 于 被 引文 献 摘 要 和 人 全文, 能够 提供 更 加 客观 和 丰富 
的 语义 信息 ,表达 施 引 作者 对 原始 文献 价值 的 认 
识 ” 。 因 此 ,笔者 认为 引文 内 容 作 为 科学 传播 与 交流 
的 痕迹 ,知识 基因 的 动态 表达 需要 从 引文 内 容 中 提取 。 
静态 摘要 与 动态 引文 内 容 的 功能 表现 如 表 1 所 示 : 
表 1 摘要 与 引文 内 容 的 功能 分 析 


功能 表现 摘要 引文 内 容 
视角 作者 视角 读者 视角 
描述 角度 主观 价值 客观 价值 
表现 形式 静态 表现 动态 表现 
表现 层次 宏观 层次 微观 层次 
侧重 点 创新 性 知识 基础 
分 析 维 度 单一 维度 5 个 维度 
分 析 依 据 内 生 指标 外 生 指 标 
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4 知识 基因 类 别 


知识 与 知识 之 间 的 连接 构成 一 张 复杂 的 知识 网 
络 ” ,在 知识 网 络 中 对 某 一 知识 点 的 定位 需要 横 坐 标 
与 纵 坐 标的 结合 。 本 文 提出 利用 通用 知识 基因 作为 纵 
坐标 ,特定 知识 基因 作为 横 坐 标 进行 知识 基因 可 视 化 
表达 。 

通用 知识 基因 是 各 研究 领域 科技 文献 通用 的 知识 基 
因 对 象 ,比如 研究 方法 .研究 目的 ,理论 .工具 数据 等 。 

特定 知识 基因 是 基于 研究 领域 特点 的 知识 基因 对 
象 。 以 Alzheimer 研究 领域 为 例 , 特 定 知识 基因 对 象 包 
括 疾病 症状 .检测 方法 .治疗 方案 等 。 

作为 基因 的 载体 ,染色 体 在 不 同 种 类 生物 中 数量 
不 同 且 恒定 ,正如 各 个 学 科 领 域 的 研究 对 象 数 量 固定 


> 


且 不 同 。 因 此 特定 知识 基因 对 象 的 设计 需要 一 定 专业 
知识 ,根据 领域 特点 选取 研究 对 象 ,或 是 在 对 研究 领域 
有 一 定 了 解 后 ,根据 研究 领域 的 知识 库 进 行 研究 对 象 
设计 。 急 词 表 及 本 体 作 为 对 某 个 领域 知识 的 共同 理 
解 , 将 特定 领域 的 实体 概念 及 相互 关系 、 领 域 的 特性 和 
规律 进行 形式 化 描述 ,在 地 球 科学 领域 ” ,能 源 交 通 
领域 ” 、 地 质 学 领域 ”气象 领域 ”、 生 物 医学 领域 
内 广泛 应 用 ,可 为 特定 知识 基因 研究 对 象 设计 提供 
参考 。 
4.1 通用 知识 基因 类 别 

M. J. Moravesik'™! M. Garzone'™! \I. Spiegel-Rosing™™ 、 
C，Oppenheim 等 后 .R，Radoulov' ”| \ 陆 伟 ' ”| 、 秦 春 秀 "* 
等 对 科技 文本 内 容 通用 标注 对 象 进行 了 研究 , 见 表 2。 
这 些 标注 对 象 可 以 表征 科技 文献 的 通用 知识 基因 。 


表 2 科技 文献 内 容 标准 对 象 
C NR Moavesik ML Camone 1 Spiegel-Rosing De Me R. Radoulov 陆 伟 秦 春 秀 
(> 概念 V V V 
OO 定义 V 本 
ET。 解释 ,内涵 V 
OO 理论 ,原理 V 于 本 已 
这 问题 Vv I 
© 数据 V V V V 
OQ 宙 V Vv 
> ”设备 V 
< 条 件 V 
5 工具 V V oy 
CS 方法 V V V V V Vv 
C 己 上 康 . 架 V vy 
加 假设 V 
算法 y y 
公式 V 
方程 A Vv 
模型 gS Vv 
系统 Vv 
应 V V 3 yy 
结果 V V 
未 提 及 时 


这 些 通用 标注 体系 框架 在 实际 应 用 过 程 中 ,如 果 
区 分 过 于 详细 , 则 对 标注 人 员 的 区 分 能 力 要 求 过 高 ;者 
是 区 分 过 于 笼统 , 则 失去 通过 标注 实现 细 粒 度 知 识 组 
织 的 意义 。 因 此 ,笔者 结合 前 人 研究 ,将 区 分 度 较 低 标 
注 对 象 进行 合并 ,选取 以 下 标注 对 象 作为 通用 知识 基 
因 表达 对 象 :概念 (包含 解释 .定义 内涵、 原理 、 理 
论 ) 问题 数据, 材料. 设备、 工具 \ 方 法 (包含 方案 . 步 


又 ) 算法 (包含 方程 公式 ) 模型 (包含 系统 ) 、 应 用 、 
其 他 。 
4.2 特定 知识 基因 类 别 

不 同 的 研究 领域 存在 不 同 的 特定 领域 知识 基因 ， 
比如 在 医学 领域 ,每 一 种 疾病 都 有 它 的 因果 关系 , 当 身 
体内 的 细胞 、 组 织 和 器 官 发 生 能 病理 变化 ,或 是 生化 反 
应 出 了 问题 时 ,就 会 反映 在 病人 的 症状 和 身体 检查 的 
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异常 结果 上 。 因 此 ,身体 内 部 的 不 正常 变化 ,可 以 解释 
询 床 上 所 观察 到 的 现象 ,在 诊断 疾病 时 ,可 利用 外 在 的 
表现 做 线索 ,寻求 致 病原 因 ” 。Alzheimer 疾病 的 因果 
关系 ,至 今 仍 为 谜团 ,临床 表现 和 病理 变化 表现 的 结 
合 , 是 病理 生理 学 探讨 病因 与 结果 的 基础 。 笔 者 根据 
https ://medlineplus. gov/alzheimersdisease. html 及 ht- 
tps://Awww. nia. nih. gov/health/alzheimers 网 站 中 对 
Alzheimer 的 基本 知识 分 类 介绍 ,结合 电子 病历 的 对 象 
研究 ,设计 了 Alzheimer 研究 领域 的 特定 研究 对 象 。 这 
些 研 究 对 象 可 以 作为 特定 领域 知识 基因 的 类 型 表达 ， 


如 表 3 所 示 : 
表 3 ” Alzheimer 研究 领域 特定 知识 基因 类 型 表达 
知识 基因 类 型 解释 具体 表现 
喀 病 症状 。 客观 病态 改变 记忆 丧失 ,混淆 时 间 地 点 、 数 值 计算 
殿 斌 病因 。 致 病因 子 和 条 件 B -淀粉 样 蛋白 ,基因 .糖尿病 .抑郁 
CD 症 等 
借助 仪器 等 的 化 验 检 、 神 经 影像 检查 、 脑 疹 液 检查 等 
分 析 
NINCDS-ADRDA 诊 ”前 期 .中 期 后 期 
断 标准 
改善 认 知 功能 ,控制 ” 益 吞 药 、 抗 精神 病 药 、 促 脑 代谢 药 等 
对 健康 影响 的 积极 ”行为 矫正 .生活 能 力 培 训 、 记 忆 能 力 
应 对 训练 等 


知识 基因 的 遗传 与 变 
.MONOD. 认为 ,知识 与 生物 体 一 样 ,通过 融合 、 


基因 在 遗传 或 变异 的 过 程 中 是 人 为 选择 产生 的 结果 , 基 
因 通过 子 代 的 特性 和 性 状 表现 对 亲 代 的 遗传 或 变异 ,而 
知识 基因 通过 引文 内 容 展 示 对 原始 文献 的 遗传 或 变异 。 
这 些 人 为 选择 在 科技 文献 中 体现 为 引文 的 基本 性 质 ， 
如 :引用 位 置 .引用 情感 \ 引 用 功能 ,引用 性 质 等 。 


判别 对 象 : 子 代 VS 亲 代 


判别 对 象 ， 原文 VS 引文 


0 
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图 3 知识 基因 遗传 与 变异 机 制 

科研 人 员 根 据 自 身 的 知识 背景 、 研 究 方向 .引用 动 
机 、 引 用 目的 .引用 情感 等 对 原始 文献 进行 解读 ,正如 
“一 千 个 读者 就 有 一 干 个 哈姆雷特 ” ,科研 人 员 在 进行 
引用 时 ,受到 自身 研究 主题 .对 被 引文 献 的 情感 等 主观 
因素 的 影响 ,使 得 文献 在 后 续 各 篇 施 引文 献 中 的 价值 
不 可 等 同化 。 在 引文 内 容 分 析 时 , 需 考 虑 以 下 多 种 不 
同 的 因素 :作者 对 被 引文 献 的 引用 态度 是 积极 还 是 消 
极 ;引文 在 文献 中 的 位 置 可 以 表征 引文 的 重要 程度 ; 引 


及 分 离 维持 其 结构 并 繁 入 生息 。 知 识 的 “传播 
加 “感染 力 "通过 互动 促进 传播 。 淘 状 也 在 演化 过 
程 外 扮演 重要 角色 ,通过 淘汰 机 制 加 速 社会 进步 co 。 
“传播 力 "或 “感染 力 "在 丹 尼 特 眼中 为 “一 辆 在 各 个 心 
智之 间 传递 卓越 知识 的 四 轮 马 车 "1。 

知识 基因 的 遗传 表现 为 知识 代 际 之 间 的 传承 ,在 
惯性 作用 下 形成 国定 价值 ,维持 人 类 知识 的 稳定 性 。 
快速 且 动 态 发 展 的 社会 冲击 着 固化 知识 基因 遗传 , 知 
识 通过 不 断 变异 适应 新 环境 , 即 知识 的 创新 ,知识 的 创 
新 使 原 有 知识 不 再 按照 原 有 知识 发 展 路 径 进化 ,而 是 
产生 知识 基因 变异 。 知 识 基因 的 遗传 与 变异 在 交叉 学 
科 中 表现 最 为 明显 。 交 叉 学科 是 相 邻 学 科 间 的 理论 交 
又 渗透 .相互 吸收 、 有 机 融合 。 各 种 知识 相互 碰撞 产生 
知识 的 遗传 与 变异 ,使 学 术 研 究 产生 新 动力 ,孕育 重大 
科技 成 果 。 
5.1 ”知识 基因 遗传 与 变异 影响 因素 分 析 
基因 经 过 自然 选择 ,产生 遗传 或 变异 现象 ,而 知识 


的 是 文献 中 的 概念 还 是 文献 的 实际 应 用 等 。 在 每 篇 
文献 中 这 些 影响 因素 的 表现 情况 不 尽 相 同 ,应 将 这 些 
因素 纳入 考察 范围 ,对 引文 内 容 进 行 分 析 建 模 计算 。 
主要 包括 提取 引用 位 置 判断 .引用 情感 计算 .引用 功 
能 .引用 性 质 .引用 类 别 等 。 通 过 这 些 内 容 分 析 为 知识 
基因 的 遗传 与 变异 判别 提供 依据 。 引 文 内 容 对 遗传 与 
变异 影响 因素 分 析 如 表 4 所 示 , 不 同 影响 因素 之 间 的 
关系 见 图 4。 

下 面具 体 分 析 不 同 影响 因素 。 

(1) 引用 位 置 因素 。H. Voos 认为 将 引用 位 置 及 
引用 功能 相 结合 可 计算 引用 的 实际 价值 ” 。S. Teufel 
经 实证 研究 发 现 62.7% 的 参考 文献 对 原文 无 实质 性 
贡献 , 仅 有 18.9% 的 参考 文献 为 原文 献 的 术语 定义 或 
工具 使 用 等 部 分 内 容 提 供 价值 输出 。B. A. Lipetz 
对 引文 位 置 对 文献 的 贡献 进行 实证 研究 ,认为 与 介绍 
背景 相关 的 引用 对 文献 的 科学 贡献 较 小 ,而 文献 综述 
等 可 以 指出 当下 问题 存在 哪里 的 引用 对 文献 的 科学 贡 
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表 4 引文 内 容 对 遗传 与 变异 影响 因素 分 析 


一 级 影响 因素 二 级 影响 因素 影响 因素 描述 
引用 位 置 引言 部 分 引文 在 文献 中 的 位 置 不 同 ,对 施 引 文献 的 贡献 价值 也 不 同 。 综 述 部 分 引文 数量 多 ,主要 是 对 发 展 历程 的 
综述 部 分 可 顾 , 其 重要 性 相对 减少 ,知识 基因 遗传 因素 更 多 ;而 方法 论 等 部 分 引文 数量 少 ,对 问题 的 进一步 探讨 使 
方法 论 部 分 其 影响 力 增加 ,知识 变异 可 能 性 增 大 。 
实验 部 分 
结果 讨论 部 分 
引用 情感 积极 引用 引用 情感 体现 作者 对 被 引文 献 所 做 工作 的 正面 .中 立 负面 的 情感 态度 。 正 面 态度 遗传 性 大 ,负面 态度 变 
中 立 引用 异性 大 。 
消极 引用 
1 引用 功能 相关 研究 相关 研究 及 现 有 研究 功能 的 引用 多 为 简单 提 及 ,较为 普遍 ,遗传 性 大 ;比较 研究 及 延伸 研究 功能 的 引用 可 
比较 研究 以 激发 新 的 想法 ,变异 性 大 。 
现 有 研究 
延伸 研究 
引用 性 质 定义 类 型 引 j 引用 性 质 体现 论文 的 实质 性 输出 内 容 形式 ,其 贡献 也 不 相同 。 定 义 类 引用 遗传 可 能 性 大 。 
I] > 型 引 上 
引用 类 别 根据 具体 领域 进行 设计 见 表 3 与 前 文 
于 
™ 创新 部 分 研究 
> Te 
CN 
CD 
名 
引用 位 置 引用 情感 引用 强度 
S a 
< 十 
©O 
af) 
CN 
© 
CN 
加 图 
人 
加 
一 
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图 4 不 同 影响 因素 之 间 的 关系 


献 较 大 ,具有 一 定 的 引用 意义 ”。G. Herlach 将 引言 
与 文献 综述 部 分 合并 ,将 方法 论 与 结果 讨论 部 分 进行 
合并 ,经 过 分 析 得 到 方法 论 与 结果 讨论 部 分 对 引证 文 
献 贡 献 更 大 “! 。X. Zhu 通过 自动 特征 选择 使 用 有 监 
督 机 器 学 习 方 法 建立 了 学 术 影 响 预 测 模 型 ,该 模型 使 
用 特征 之 一 为 位 置 特征 , 且 这 一 特征 在 实验 中 发 挥 重 
要 作用 。 

通过 上 述 研究 分 析 , 笔 者 认为 出 现在 文章 引言 则 
分 的 引用 对 引文 的 科学 贡献 较 小 ,在 进行 知识 基因 遗 
传 与 变异 计算 时 需要 降低 变异 计算 权重 , 提高 遗传 计 
算 权 重 。 实 验方 法 位 置 的 引文 则 需要 降低 遗传 计算 权 


重 ,提高 变异 计算 权重 。 

(2) 引用 强度 因素 。M. ]， Moravesik 对 宛 余 引用 
进行 实证 研究 ,认为 连续 引用 多 为 经 典 理论 方法 的 引 
用 ,属于 宛 杂 引用 ,作者 对 30 篇 文献 575 条 参考 文献 
进行 分 析 后 ,发 现 1/3 的 引用 为 元 杂 引 用 。 常 思 敏 
将 连续 引用 判定 为 拼凑 性 元 余 引 用 ,并 指出 其 对 后 文 
的 叙述 没有 任何 铺垫 作用 。M. H.，Macroberts 将 引 
用 分 为 有 影响 力 引用 与 无 影响 力 引 用 ,研究 结果 显示 
有 影响 力 引 文 数量 较 少 "* 。 

本 文 认为 应 将 词语 引用 及 连续 度 大 于 3 的 连续 引 
用 降低 在 遗传 和 变异 计算 过 程 中 的 权重 。 
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(3) 引用 情感 因素 。D. EE. Chubin 将 引文 分 为 积 
极 引 用 与 消极 引用 并 进行 人 工 判 读 ,结果 表明 95% 论 
文 为 积极 引用 "9 。M. J]，Moravesik 将 引文 分 为 积极 引 
用 中立 引用 消极 引用 ,并 通过 设置 问题 进行 人 工 界 
定 , 结 果 表 明 84% 论文 为 积极 引用 。 在 此 之 后 ,M. 
J Moravcsik 将 选择 限定 在 积极 引用 与 消极 引用 后 , 积 
极 引用 所 占 比例 达 92% :2 。 在 国内 , 刘 盛 博 将 引用 内 
容 分 为 正面 .中 性 负面 ,对 BMC-bioinformatrics 期 刊 进 
行 实证 研究 ,结果 表明 62. 88% 的 引用 为 中 性 引用 , 负 
面 引用 为 3.53%“” 。 经 上 述 研究 表明 ,国外 作者 对 积 
极 引 用 的 判断 具有 一 致 性 ,将 大 部 分 引用 归 为 积极 引 
用 ,与 国内 作者 判断 存在 一 定 的 差异 。 国 内 人 员 对 积 
极 引 用 的 判断 界定 高 ,将 大 部 分 引用 判断 为 中 性 引用 。 


答对 消极 引用 判断 时 ,国内 外 作者 在 数量 方面 存在 一 


4 ,只 有 非常 少数 引用 为 消极 引用 。 消极 引用 的 文 
献 婴 然 对 原文 进行 引用 ,但 原文 所 表达 的 主要 思想 并 
© 


引用 位 置 分 析 


引用 功能 分 析 


未 得 到 传承 ,与 原文 献 的 原意 相 违背 。 

本 文 认为 积极 引用 类 型 提高 遗传 计算 权重 ,中 立 
引用 降低 在 遗传 和 变异 计算 过 程 中 的 权重 ,消极 引用 
提高 变异 计算 权重 。 

(4) 引用 功能 因素 。S. U.。 Hassan 根据 前 期 阅读 
及 句法 结构 特征 ,将 引文 功能 划分 为 4 种 类 型 :相关 研 
究 、 比 较 研 究 、 现 有 人 研究、 延伸 人 研究。 并 汇总 各 类 型 提 
示 词 ,使 用 正则 表达 式 对 引用 进行 分 类 ,对 其 进行 国家 
与 机 构 的 评价 5 。 

笔者 认为 利用 S. U. Hassan 划分 的 相关 研究 、 现 
有 研究 引用 功能 设计 遗传 计算 权重 ,利用 延伸 研究 . 比 
较 研 究 设计 变异 计算 权重 。 
5.2 科技 文献 知识 基因 遗传 与 变异 识别 计算 

根据 前 面 辨析 的 知识 基因 类 型 和 影响 遗传 变异 的 
因素 ,本 文 设计 了 一 种 知识 基因 遗传 与 变异 计算 实现 
方法 ,如 图 5 所 示 : 


知识 基 


因 的 标注 


引用 情感 分 析 


积极 引用 


5 知识 基因 遗传 与 变异 的 计算 研究 
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通过 图 5 中 计算 步 又 
因 进 行 遗传 和 变异 综合 判 


后 ,根据 计算 结果 对 知识 基 
断 ,如 果 引 用 类 别 一 致 则 判 


定 为 知识 基因 的 遗传 ;如 果 不 一 致 进行 类 别 关 联 性 分 
析 , 如 果 关 联 性 弱 则 判断 为 知识 基因 的 变异 ;如 果 关 联 
性 强 , 小 于 权重 闷 值 的 判断 为 知识 基因 的 变异 ,大 于 权 


重 半 值 的 判断 为 知识 基因 的 遗传 。 权 重 与 阔 值 的 设置 
根据 科技 文献 所 属 领域 的 文献 特征 决定 。 


6 狭义 知识 基因 与 广义 知识 基因 


(1) 狭 义 知 识 基因 。 笔 者 将 基于 单 篇 文献 的 知识 


基因 定义 为 狭义 的 知识 基 
值 进行 结构 化 提炼 与 组 织 


,并 在 微观 层面 对 文献 价 
。 在 应 用 上 , 单 篇 文献 全 文 


细 料 度 结构 化 知识 基因 提取 可 提高 文献 知识 发 现 效 
来 二 同时 ,科技 文献 知识 基因 可 用 于 单 篇 科技 文献 知 
讶 洪 价 ,通过 后 续 施 引 文献 的 遗传 或 变异 表示 论文 的 


内 得 答 出 能 力 。 


@Cz) 广 义 知识 基因 。 上 述 知识 基因 的 定义 与 应 用 
大 下 单 篇 科技 文献 ,是 狂 义 的 知识 基因 定义 。 科 技 广 


SS 


人 


其 妆 学 科 领 域 的 发 展 与 变 


化 轨迹 ,出 现 广 义 上 的 知识 


基因 ,可 用 于 描述 宏观 领域 的 知识 进化 轨迹 。 


污 广 义 知 识 基因 可 以 控 


制 知识 发 展 的 方向 ,是 某 个 


学 各 研究 方向 中 文献 的 共有 知识 基因 体现 ,如 福 柯 
所 中 :一 只 看 不 见 的 手 通 过 认 知 模式 控制 着 知识 系 
统 2'21 。 某 些 文献 在 宏观 层面 存在 相似 知识 基因 ， 
并 通过 知识 基因 节点 紧密 连接 在 一 起 ,形成 其 研究 


方向 。 


7 _ 结语 


知识 的 发 展 与 自然 界 人 类 发 展 存在 一 定 共 性 。 波 
普尔 指出 ,知识 的 发 展 与 生物 的 进化 存在 着 惊人 的 相 
似 之 处 ,包括 地 球 在 内 的 全 部 宇宙 自然 界 的 第 一 世界 
与 包括 人 类 所 创造 的 语言 文艺 作品 .宗教 .科学 .技术 


等 客观 知识 世界 的 第 三 世 


界 在 发 展 中 存在 相似 规律 。 


基因 要 素 作 用 于 知识 组 织 系统 的 两 大 重要 作用 机 制 为 
遗传 与 变异 机 制 。 随 着 生命 科学 的 飞速 发 展 ,人 类 逐 


渐 掌 握 基 因 的 结构 和 作用 


机 理 , 并 发 现 基因 的 发 展 符 


合 自然 辩证 法 ,与 其 他 事物 发 展 存在 相似 规律 。 基 因 


与 知识 基因 同样 符合 相同 


的 自然 法 则 规律 ,通过 对 知 


识 基因 理论 的 研究 ,可 使 我 们 更 加 准确 把 握 知识 演化 
规律 ,促进 科学 技术 的 迭代 发 展 。 
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A Study of 人 Knowledge Meme Heredity and Mutation in Academic Paper 
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Abstiract: | Purpose/significance | The accumulation and inheritance of knowledge promotes the development of 
human society. This paper proposes to study the inheritance and variation of knowledge by using the knowledge gene 
of scientific and technological literature, in order to have a more intuitive and comprehensive perspective on the in- 
heritance and development of knowledge. | Method/process | By analyzing the narrow and broad definitions of 
knowledge genes ，the research significance of knowledge genes was determined and their specific research objects 
were discussed. Two ways of expression of knowledge genes in scientific and technological literature were proposed ， 
and the types of knowledge genes in scientific and technological literature were analyzed. The main factors affecting 
Whe inheritance and variation of knowledge genes were summarized, and the inheritance of knowledge genes was de- 
ESigned，And the method of variation. | Result/ conclusion | The identification of knowledge genes in scientific and 
GRhnolosical literature can effectively reveal the knowledge inheritance and iteration between different documents, 

nd promote the development and perfection of the theoretical system of knowledge memes. 
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